人工智能开荒记

查看原文

其他

人工智能开荒记

Original: 沐木 ToB行业头条 2019-05-10

点击蓝字关注更多To B大事

作者 /沐木 · 编辑 /Jenny Robin

来源 / 企服行业头条（ID：wwwqifu）

打开手机，你能找出多少人工智能的影子？

你读的新闻可能是人工智能写的，拍的照片可能是人工智能帮你美颜过的，你喜欢的那家餐厅可能是人工智能为你推荐的，你看不懂的单词是人工智能帮你翻译的。还有很多尚未普及的人工智能存在：自动驾驶技术、交通调度系统、机器人…..

人工智能开始脱离抽象的文学作品、炫酷的电影特技，逐渐在可感官的现实生活中生存、进化，成为生活必需品。只是人工智能还无法像《西部世界》描述的那样，能够获得对自身和外界更为深刻的认知、智慧积累和情感表达。

1956年举行的达特茅斯会议，被认为是人工智能的起步标志。

但在60年代和80年代爆发的人工智能，都高调出场，期待落空谢幕。随着深度学习算法的突破、互联网时代海量数据的积累、以及芯片强大计算能力提升，人工智能进入第三次爆发阶段。

只是国内人工智能研究从80年代才开始起步，一直是被动的追赶者、学习者。在前两次轰轰烈烈的人工智能浪潮中，基本没我们什么事，一直在努力缩短与发达国家之间的差距。

作为继蒸汽技术、电力技术、计算机及信息技术革命之后的第四次科技革命核心驱动力，人工智能将形成新的「生产力」。在与「第四次科技革命」的「贴身肉搏」中，中国市场基于过去几十年的技术积累开始力量爆发，成为这波人工智能浪潮中颇具实力的参与者。

掌握人工智能技术意味着几百年前与工业革命失之交臂的遗憾，将有可能因此终结。可是回顾过去40年国内人工智能的发展，从一无所有到奋起直追、加速研发创新，崛起并不意味着走了很远，可能还是「局部很精彩，整体很无奈」的状态。

停滞

建国初期，百废待兴，国内掀起一股「苏联热」。有数据统计，在建国前三年，光是以「中苏友好」为主题的演讲、讲座和报告就有近9.9万次，用中文出版的苏联书籍就有3100多种。

18岁就考上清华大学的张钹，就读于电机系，电机与电气制造专业。在那个「每个月一块五毛生活费」的年代，电机系培养的就是最前沿的科技人才了。

当时张钹学习各门课都采用苏联教材，既要补全基础知识，又强调实践，很是容易引起挫败感和紧张感。不过张钹还是咬牙坚持下来，也很快成绩名列前茅。

在1956年，读大三的张钹获得了一次改变命运的机遇。那年《国家十二年科学技术发展远景规划》出台，举国发力研制「原子弹、核武器、火箭」。

清华大学被要求增设新专业，培养相关专业人才。于是正在读大三的张钹被调入清华计算机系的前身，也就是自动控制系统专业。后来清华大学对人工智能的研究基本都源于此。

1946年，美国军方定制的世界上第一台电子计算机埃尼阿克问世了，造价近50万美元，占地170平米，与6头大象的体重相近，主要用于弹道计算。

在张钹大三转系的那一年，才是国内计算机发展的起步之年。当时的12年规划中确定中国要研制计算机，批准中国科学院成立计算技术、半导体、电子学及自动化四个研究所。

但50年代前后国外科学家已经在为人工智能第一次爆发做准备，摸到了一些眉目，具备了理论基础和操作工具——计算机的支撑。国内的科研仍处于刀耕火种时期，要先解决国防安全、工业发展和民生经济问题。

毕业后，张钹选择留校任教，第一项工作任务就是为四年级学生开设《飞行器自主控制系统》。当时这门课还没有教科书和参考资料，属于保密专业，能够开设还是靠张钹在苏联专家「开小灶」学来的。

在什么都缺的年代，紧迫感促使人学习，不断激发潜力，突破能力和认知的边界。经过7届学生的实践，张钹等人终于完善了「飞行器自动控制系统」专业的教学体系。直到文革之前，张钹都在自动控制系任教，主要承担不同工业部门的科研任务，包括电子、兵器、航空、航海等，研制过多种军用或民用的自动化系统。

除了国情限制了人工智能研究的进展，国内人工智能在50年代和60年代还深受苏联影响，一直处于停滞状态。苏联对人工智能的研究受限，主要是受「控制论」的影响。

当时麻省理工学院的数学家诺伯特·维纳在1948年出版了《控制论：或关于在动物和机器中的控制与通信的科学》。这本书提出，「控制论将指导人们造出可以思考和想象、通过自主学习变得比人更加聪明的自适应机器」。

「控制论」还引发了赛博文化的诞生。赛博文化中，人脑和电脑的直接连接，故事都发生在网络上、数码空间中，现实和虚拟现实之间的界线很模糊。

维纳的「控制论」具有前瞻性，也都受到苏联和美国军方的推崇。本来苏联学术界在「控制论」明目下还是能曲线做人工智能研究。很快就在50年代末期，受到苏联官方针对「控制论」的批判运动，将其斥为「资产阶级的反动伪科学」。

跟维纳同时期出版的小说《1984》，是英国左翼作家乔治·奥维尔在1948年创作的虚构文学作品。他对集权统治下的乌托邦世界的控制有过栩栩如生的描写。

作品中的未来社会，人们需要面对无处不在的电幕、思想警察的监听，生活在真理负责修改历史、和平部发动战争、友爱部对百姓进行拷打、无知即是力量、战争即是和平，自由即是奴役的社会中……

《1984》电影截图，主人公温斯顿在真理部工作，负责遵循领袖意志伪造历史。房间的设有电幕，配有「老大哥在看着你」的画面。

奥维尔创作《1984》，还是出于他在战争中目睹和经历了斯大林主义的狠辣手段，认为这是对马克思主义的背离，并不是社会主义，而是一种不健康的社会形态。虽然到了上世纪60年代赫鲁晓夫当政后，「控制论」逐渐被解冻。不过，苏联学术界更多的还是在讨论「人工」能造出「智能」吗？这类哲学层面的论证。

后来中苏交恶，中国学术界则认为苏联的这种解冻是一种「修正主义」，人工智能也并未得到重视。但是在上世纪50年代到60年代期间，国外人工智能迎来第一个发展高潮，被称为人工智能的「黄金时代」。

世界上第一家机器人制造工厂——Unimation公司；
世界上第一个聊天机器人ELIZA；
首台采用人工智能的移动机器人Shakey等，都是那段时期的产物。

只是受计算机算法算力的限制，人工智能的局限性仍然很大。比如移动机器人Shakey，控制它的计算机有一个房间那么大。

当时计算机有限的内存、处理速度等都不能解决任何实际的人工智能问题。比如要求程序对这个世界具有儿童水平的认知，研究者们很快发现这个要求太高了。1970年前后还没人能够做出如此巨大的数据库，也没人知道一个程序怎样才能学到如此丰富的信息。

所以为人工智能研究提供资助的机构，比如英国政府、美国国防部高级研究计划局（DARPA）等也就逐渐停止资助无方向的人工智能研究。于是70年代人工智能在国外进入了第一个寒冬。人工智能在国内才经历停滞到解禁阶段。真正的开荒才刚刚开始。

起步

1978年，又是改变无数人命运的一年。经济倒退的火车要急刹车向前开。科学界也开始集中火力填补技术空白。

同年的全国科技大会上，吴文俊提出的利用机器证明与发现几何定理的新方法——集合定理机器证明，能够让计算机具备自动证明某一类几何定理的原则和方法，也就是数学问题的机器化。在此基础上，很快形成一系列能在国际上拿出手的成果，包括曲面造型、机器人机构的位置分析、智能计算机辅助设计、信息传输中的图像压缩等。

同样1978年召开的「中国自动化学会年会」上，出现了光学文字识别系统、手写体数字识别、生物控制论和模糊集合等研究成果。这意味着人工智能在生物控制、模式识别等方面开始有起色。第二年，清华大学电子工程系更名为计算机系，而原来的无线电系则从四川绵阳搬回北京，更名为电子工程系。

从国防核武器研发前线退下来的钱学森也在80年代初期主张进行人工智能研究。大批留学生前往发达国家研究现代科技，学习国外前沿科技成果。张钹和林尧瑞、石纯一、黄昌宁等人决定探索新的研究方向，把人工智能与智能控制作为该教研组新的专业方向。此后，清华大学成为国内最早开展人工智能研究的机构之一。

在1978年招收首批人工智能方向的研究生
1983年成立首个智能机器人实验室
1983年在国际人工智能大会（IJCAI）上发表第一篇学术论文
1990年成立全国第一个有关人工智能的国家重点实验室——「智能技术与系统」国家重点实验室
2018年成立跨系的交叉研究机构——「清华大学人工智能研究院」，张钹现任清华大学人工智能研究院院长。

1981年，工智能学会(CAAI)在长沙成立，标志着国内人工智能研究正式起步。但是80年代，国内还在大力发展计算机产业、搭建人工智能的研究框架、项目，国外人工智能已经进入了第二次爆发期。

一个尝试是日本在80年代初期提出「第五代计算机」（简称五代机）计划，也就是制造出能够具备推理能力、知识智能处理功能的「人工智能计算机」。这让全球的科学家、政客都颇为震撼。

这样的自信主要来自日本过去几十年间高精端制造业的发展，比如在DRAM存储芯片方面，日本当时的技艺都不差美国。所以日本想在计算机硬件制造方面，尤其是在IT领域建立自己的标准，实现弯道超车，甩掉山寨的帽子。

1981年4月，奥斯本（Osborne）公司发布了一款名叫Osborne 1的便携电脑，是世界上第一台便携式电脑。

五代机计划让美国和欧洲都打起了精神，迅速反应组建团队，增加在计算机领域的研发投入。比如美国在1982年就迅速组建了MCC，作为对日本五代机项目的回应。每年投资7500万美元，设置600个职位，邀请了除IBM和AT&T之外的美国所有重要高科技公司都参与进来。

英国政府在同年婉拒了日本邀请联合开发五代机的提议后，自己投入3亿6千万美元成立「阿尔维计划」，目的就是要保证英国在先进的信息技术方面，要有国际竞争力。

当时国内还在研究第四代计算机，对五代机的竞争很是力不从心。到了1985年，中科院计算才在所在IBM微型计算机基础上，研发出了联想式汉化微型机LX-PC系统。随着联想品牌被人熟知，以销售联想汉卡为主的计算所公司改名为联想集团。

后来涌现了一大批电脑制造企业，如四通、方正、同创、实达等，但主要都是通过组装计算机或者代理IBM、HP、康柏等跨国巨头的产品从中获利。后来在1996年，联想PC销量超过了IBN、HP，成为当时国内计算机行业的龙头公司。

1987年，第一封电子邮件「越过长城，通向世界」，从北京经意大利向前联邦德国卡尔斯鲁厄大学发出。这标志着国内互联网迈出的第一步。

也正是在那一年，日本五代机计划进入难产状态，英国宣布放弃阿尔维计划，这基本标志着五代机计划失败。日本人工智能学者后来认为如果有现在的语义网和知识图谱的大数据，五代机结局会很不同，这也只是后话了。

当时另一个努力是美国生物物理学家J.J.Hopfield在1982年、1984年发表了两篇论文，提出新的神经网络模型，为实现神经网络工程指明了方向。这引起了又一波「人工神经网络」热潮，有人称其为「第六代计算机」。当时学术界寄希望利用自学习算法，让复杂的非线性网络具有超出数值计算范畴的人工智能。

但是DARPA还是把研究款项拨给那些看起来更容易出成果的项目，把人工智能打入了第二次寒冬。究其原因，还是人工智能计算机想法太超前，没有在智能化层面做出实质性的突破进展。

追赶

人工智能的发展史，可以看作是一部信息技术和产业的发展史，也是一部新兴信息产业巨头抢占明日高地的「更迭史」。

第一代信息产业代表们是微软、因特尔、IBM、甲骨文；第二代是伴随互联网和移动互联网而生的谷歌、苹果、脸书、亚马逊、腾讯、百度、阿里等；那么，第三代能最有可能占领高地的就是拥有人工智能技术的公司。

在第二次AI寒冬中，计算机产业不再企图从根本原理上实现人工智能，而是进入「信息高速公路」浪潮，结合软件发挥优势。人工智能就主要被用于提高软件系统的容错、检错、自动修复等，神经网络也取得一些商业成功，应用于光字符识别和语音识别等软件中。

1994年，《科技日报》发表关于「世界十大科技新闻」的评论，头条是：全世界兴起信息高速公路热潮，美、英、法、日、加拿大和韩国等20多个国家计划相继出台，信息高速公路的概念从国家范围的信息结构开始扩展为全球信息结构。然后第十条新闻，也是唯一一条国内的科技大事件是「长江三峡工程正式开工」……

「信息高速公路」计划将INTERNET、电话、电视、无线通讯系统融为一体，来为科教、医疗、金融、商业、娱乐等提供信息服务。也就是说从90年代中期开始，全球互联网浪潮大幕拉开。

到了1998年，全球已经有1.5亿「网民」，每天都有2000台计算机入网。但是根据当时中国互联网络信息中心统计，国内只有100多个计算机信息网络接入国际互联网络，用户量在60万左右。

那时四通利方与北美最大的中文网站华渊生活资讯网在1998年合并，成立当时全球最大的中文门户网站「新浪网」；从「马站长」干到润迅软件工程师的马化腾看到了基于Windows系统的ICQ演示后，也想做出一款集呼叫、聊天、电子邮件于一身的软件，于是在1998年注册了腾讯。

李彦宏在1999年的圣诞节回国，立志要创办被西方网民称为「上帝」的中国版Google——百度；同年在杭州，在一个叫湖畔花园的小区，马云召集了17个人开会融资，创办了阿里巴巴网站。

文娱、通信、电商、媒体等领域开始被互联网颠覆，此后便一发不可收拾，交通出行、餐饮美业、工业制造、金融投资等各行业都在互联网化。人工智能在国内的声音被浩浩荡荡的互联网浪潮湮没过很长一段时间。

而在美国，精工品公司在90年代就发明了一种叫Quicy-tionary双语翻译机，内置了40万字的字库，支持英—法和英—西班牙语的对照版本。自动驾驶项目在80年代就被DARPA立项，成为现在各种类似项目的源头。汽车导航系统已经能够通过连接全球卫星，为司机规划路线了……

如果说80年代前，国内技术发展还是在对「计划经济」时期的矫正和摸索，80年代到90年代则是对外来技术大量引进、模仿，那么到了21世纪，从模仿到创新已经变成「魔鬼般的步伐」。

从90年代开始，计算机硬件、软件、通信、互联网以及移动互联网浪潮接踵而来，这让国内的信息技术产业进程尤为紧迫，技术创新到行业应用落地的周期不断缩短。虽然为如今人工智能的爆发做了铺垫和积累，但在后续的落地过程还是存在问题，后续会一一谈到。

过去20年间，互联网和移动互联网浪潮来袭，数据、应用大规模爆发，云计算和物联网技术也进入成熟阶段，前两次人工智能浪潮中遇到的「知识瓶颈」、「算力瓶颈」等开始有了解决方案。

人工智能从2010年前后开始进入第三个发展期。而这次国内人工智能产业终于赶上了趟，但也是一次颇具挑战的大考。

爆发

2006年，多伦多大学机器学习领域的泰斗Hinton和他的学生在《科学》刊物上发表了一篇关于「神经网络如何通过无监督学习减少出错」的论文，引起深度学习在学术界和工业界的重视。

这篇文章主要提出两个关键点：

很多隐层的人工神经网络具有优异的特征学习能力，学习得到的特征对数据有更本质的刻化，从而有利于可视化或分类。
深度神经网络在训练上的难度，可以通过「逐层初始化」来有效刻度，也就是通过无监督学习可以实现「逐层初始化」。

后来这篇论文被谷歌X实验室研究人员验证，并在2012年对外宣布，已经用1.6万台计算机搭建了拥有10亿神经连接的深度学习神经网络（DNN），在没有人工干预的前提下，具备识别物体这一感官能力。该网络也已在YouTube上试用，能够顺利识别出内容有猫的视频。

此后，深度学习技术在图像、语音、自然语言处理上都实现了低误差突破。2011年以来，微软研究院和谷歌都用DNN技术降低了语音识别错误率20%～30%，在2012年，DNN技术在图像识别领域取得惊人效果，在ImageNet上将错误率从26%降低到15%。

学术界对人工智能研究的热情暴增。联合国联合国世界知识产权组织今年发布份《2019技术趋势——人工智能报告》显示，从50年代到2016年，科研人员已提交超过34万份人工智能发明专利申请，发表的科学出版物超过160万篇(部)。而这其中的专利超过半数是2013年以后公开的。其中在国别专利总申请量方面，美国、中国、日本排在前三位。

很多公司也看到了深度学习神经网络的潜力。百度是较早成立专注深度学习研究院的公司之一，引进了大量的人才。像Fackbook前资深科学家徐伟、AMD异构系统前首席软件架构师吴韧、Twitter和Facebook数据中心建设的负责人Ali Heydari、曾训练世界级最大人工神经网络的Adam Coates等顶尖人才都加入了当时百度2013年在硅谷正式成立的百度实验室。

在国际人工智能技术竞赛中，国内的人工智能团队开始名列前茅。科大讯飞、商汤、旷视、寒武纪、地平线等展露头角的人工智能创业公司。除了互联网巨头、新兴人工智能创业公司，还有传统的生物识别公司都在人工智能领域试图占领「高地」。

比如眼神科技CEO周军从1995年开始筹划创业。 2003年指纹识别研发成功，并开始在银行业落地应用。2007年又研发出虹膜算法，到2015年，基于深度学习的人脸识别技术和产品就已在全国20多家银行上线。

这波人工智能浪潮能够看出，技术创新的驱动力不再是由国家建设为主，民营企业已经有足够的能力去研究、应用科技界最前沿的技术，并且来影响政府机构对技术方向的判断。

可是前两次的历史经验告诉我们，超乎寻常的期待，总是会得到超乎寻常的失望。尤其是媒体、资本、市场的探测灯都在寻找下一个Big Thing, 人工智能恰好满足对实现他们对科幻场景的期待。

聚光灯之后隐藏的阴影是什么？这会又是一场魔术障眼法吗？人工智能的第三次寒冬会到来吗？

市场上还有很多这样对人工智能的「质疑声」。中国人工智能学会副会长任福继看来，「过去30年来，人工智能在应用方面成果看起来风生水起，但实质上特别是在理论方面并无重大突破，而仅仅是依赖上世纪80年代开始的数据驱动，也就是大数据驱动的机器智能进化。加上云计算和物联网的出现，人工智能在算力和数据层面开始有了新的助力。」

也就是说深度学习也并不是开启通往人工智能巅峰的唯一一块罗塞塔石碑。这个理论本身是通过大量数据分析，找出重复的特征活着数据之间的统计关联性，并不是因果和本质上的特征。

目前的人工智能还集中处于「弱人工智能」阶段，在特定功能场景下的专用智能，比如语音识别、图像处理和物体分割、机器翻译、无人驾驶等领域有重大的突破，甚至能够接近或超越人类的水平，但还不能适应复杂的新环境和不断涌现出新的功能。比如对噪音数据的识别并不理想、对语义理解还仅限于娱乐。

另外，人工智能想要把IT 产业带向「认知时代」，不仅仅需要人工智能算法的创新，还需要构建认知系统、认知平台、认知算法、认知应用等完整的生态链。

以认知系统来说，一方面，需要在传统的计算机上做延展，包括用 FPGA、图形处理器来做加速，使它更好地支撑认知应用。另一方面，如何构建模仿人脑功能的新一代的计算机系统也还需要探讨。

比如发达国家已充分认识到人工智能的战略意义，除了加速将新技术落地到产业，美国、欧盟和日本从2013年起都开始设立「大脑研究计划」，要为人工智能找到更为本质的支撑系统。

还有随着去年资本新规出台、资本寒冬等政策和市场的变化，融资难的问题让大波人工智能创业公司走到破产边缘。根据《北京人工智能产业发展白皮书(2018)》对国内AI创业公司数量和投资的统计显示，截至2018年5月8日，全国人工智能企业4040家，但其中拿到风险投资的公司合计1237家(含31家已上市公司)，占总数的30%，也就是说，有70%的公司仍然拿不到投资。

和美国市场相比，国内的IT环境发展还参差不齐，人工智能发展伴随着企业数字化、云化等多重变革重叠，很难一步到位，快速落地。投资人在投项目的时候优先考虑的是市场的有效性，反而不是技术的领先性。

人工智能很可能像互联网一样，成为电、水一样的存在，进入到各行业。根据Gartner 副总裁、智能机器人领域分析师汤姆·奥斯汀所言，目前科技巨头、知名大学、研究机构分别在深度语音识别、深度影像识别、深度神经网络、自然语言处理上发力，也许要到 2050～2075 年人工智能市场格局才会稳定下来。

人工智能从「弱人工智能」到「强人工智能」的进化，究竟有多大的希望？

可能还是取决于我们对世界的认知，以及对自我的认知。毕竟人类大脑很大部分仍然处于「我们不知道自己还不知道」的状态。

本文参考资料如下：（可滑动）